Analítica de datos aplicada a estudios sobre desarrollo

Introducción a los métodos cuantitativos

Sobre Mi

PhD en Estadística, MSc en Analytics & Big Data, MSc en Estadística. Con 20 años de experiencia, actual director de analítica en el CNC, miembro del comité de expertos en pobreza en el DANE y consultor de la División de Estadística de la CEPAL. Ex-decano de la Facultad de Estadística USTA, ex-director de operaciones en el ICFES, PM CEV …

Puedes encontrarme en:

Objetivos de este curso

  1. Familiarizar a los estudiantes en el uso de herramientas para el análisis cuantitativo de datos aplicada a los estudios de desarrollo.

  2. Presentar las cuestiones prácticas y críticas en el uso de métodos de análisis cuantitativo de datos.

Resultados de aprendizaje

Al finalizar el curso, los y las estudiantes estarán en capacidad de:

  • Aplicar los principales métodos de análisis cuantitativo (análisis de regresión, técnicas de análisis multivariado).

  • Combinar distintas herramientas para el análisis cuantitativo.

Metodología

  • Es un curso de nivel intermedio donde se abordan temas de métodos descriptivos, inferenciales, métodos supervisados y no supervisados.

  • El enfoque del curso es práctico, a través de ejercicios hechos con los estudiantes. Usaremos el software estadístico R Studio. No nos concentraremos en demostraciones y pruebas formales. El curso tiene un énfasis aplicado.

  • Sesiones de repaso y aclaración de inquietudes con el Monitor alternadas semanalmente con nuestras sesiones.

Temas que se cubren



  1. Visualización de datos
  2. Análisis exploratorio
  3. Análisis de correlación y de regresión (modelos lineales)
  4. Reducción de la dimensionalidad
  5. prácticas en el software R Studio

Reglas del juego


  • Talleres: 30%
  • Examen 1: 20%.
  • Examen 2: 20%.
  • Presentación final: 30%



Conversación



¿Por qué considera que la analítica de los datos es importante dentro del proceso de la toma de decisiones o de orientación de políticas?

05:00

VISUALIZACIÓN DE DATOS

Elementos clave

  • Tipografía: Seleccione fuentes apropiadas, limitándose a 2-3 y siendo consistente en su uso.
  • Contraste: Utilizar contraste (claro/oscuro, grande/pequeño, grueso/delgado) para resaltar y enfatizar.
  • Color: Usar el color para enfatizar o reforzar valores, evitando el uso excesivo de colores que pueda distraer.
  • Balance: Asegurar que el diseño sea visualmente equilibrado para que sea agradable y destaque la información importante.
  • Jerarquía: Proporcione pistas visuales sobre la parte más importante del mensaje.

Elementos clave

  • Despejar el gráfico: Elimine líneas, bordes y marcas de verificación innecesarias para evitar distracciones.
  • Títulos y etiquetas con propósito: Ser claro y conciso en los títulos y usar etiquetas de datos con moderación.
  • Usar el eje completo comenzando en cero para evitar malinterpretaciones de los datos.
  • Evite gráficos de pastel especialmente para comparaciones, ya que son difíciles de interpretar visualmente.

Lectura recomendada: Data Visualization Principles

Tipos de gráficos

Galerias de gráficos en R: https://r-graph-gallery.com/

Inspiración


SOFTWARE R

Proceso de analítica

Wickham, H. y otros (2023)

Paquete R

  • Paquete de uso libre

  • Tiene todos los métodos que necesitamos

  • Incluye paquetes específicos para la visualización como ggplot2, Plotly, esquisse, tidyplots, etc

R logo

Etapas del proceso

Paquete estadístico

Arte de Allison Horst

R y R-Studio

Arte de Allison Horst

Trabajando en R

El entorno tidyverse

Flujo de trabajo

instalación



Reglas de los datos



Tipos de variables

Tipos de variables

Comandos iniciales: estructura

Existen varias formas de observar la estructura de los datos

Los comandos head, str, names son del paquete base mientras que glimpse es del entorno tidyverse.

Ejercicio



Tu turno: Cargue el conjunto de datos “ENSIN.sav”, explore los datos y visualice su estructura.

library(pacman)

p_load(tidyverse, haven)
15:00

GRACIAS!

Referencias

  • Husson, F., Lê, S., & Pagès, J. (2017). Exploratory multivariate analysis by example using R. CRC press.

  • Hair, J. F., Black, W. C., Babin, B. J., Anderson, R. E., & Tatham, R. L. (2006). Multivariate data analysis 6th Edition. https://doi.org/10.1201/9780367409913

  • Aldás Manzano, J., & Uriel Jiménez, E. (2017). Análisis multivariante aplicado con R. Ediciones Paraninfo, SA.